Métricas de curación fallan en defectos estructurales de políticas de imitación
Las métricas de curación solo-acción fallan ante defectos estructurales en demostraciones. Incluso las mejores solo recuperan un tercio del rendimiento.
Las métricas de curación solo-acción fallan ante defectos estructurales en demostraciones. Incluso las mejores solo recuperan un tercio del rendimiento.
Las métricas de solo acciones no detectan defectos estructurales clave en demonstraciones. Un estudio revela que solo métricas de trayectoria de estado mejoran
LadderMan: robots humanoides escalan escaleras y manipulan objetos. Sistema híbrido de aprendizaje y visión por IA. Transferencia sim-to-real sin ajustes.
El condicionamiento del éxito optimiza políticas imitando aciertos. Aprende la teoría y su aplicación en IA.
Descubre Instant-Fold: robots manipulan objetos deformables con una sola demostración humana, sin necesidad de entrenamiento adicional. Aprende cómo.
Descubre SPADE, el nuevo método que combina bocetos y difusión para planificar rutas de robots móviles con un 39% menos de error y un 93% menos parámetros.
Modelo MAYA basado en bandidos multi-brazo reproduce decisiones de forrajeo de abejas con memoria limitada. Ventana temporal óptima de 7 pruebas. ¡Lee más!
Aprendizaje por imitación sin entrenamiento: políticas de difusión cerradas logran inferencia en tiempo real en CPU móvil con rendimiento competitivo.
Los modelos de dinámica inversa predictiva superan a la clonación de comportamiento en eficiencia de muestras. Explicación teórica y validación empírica.
Descubre cómo HOIST combina imitación y RL para que humanoides manipulen cargas suspendidas con alta precisión. Reduce errores de colocación en 19.9 cm.
AffordGen genera datos diversos para manipulación robótica con generalización zero-shot. Aumenta la eficiencia del aprendizaje por imitación.
Descubre cómo los videos humanos entrenan robots con modelos VLA escalables. Encuesta sobre aprendizaje robótico con datos humanos.
IDP: genera acciones en un paso con corrección del entrenamiento usando geometría condicional de experto. Ideal para control robótico de alta frecuencia.
SWIM: nuevo método de imitación para animación de natación. Aprende de un solo movimiento, se adapta a entornos y estilos. Eficiente, robusto y generalizable.